3. ИНСТРУМЕНТАРИЙ ИССЛЕДОВАНИЯ МЕТАФОРЫ
3.1. Методика построения словаря
Архитектура системы
Система автоматизации построения словаря метафор состоит из базы данных (содержащей словарные статьи словаря метафор, рубрикатор терминов, рубрикатор метафорических моделей, толкования терминов и метафор, ассоциации) и программного комплекса. Основными функциями программного комплекса системы являются: ввод данных в базу и их редактирование, анализ информации, построение отчетов. Система состоит из модулей, реализующих эти функции.
Ввод данных в базу и их редактирование. Реализацию системой данной функции выполняют следующие модули: модуль ввода и редактирования словарной информации, модуль заполнения рубрикатора терминов и рубрикатора метафорических моделей, модуль ввода и редактирования толкований терминов и метафор, модуль ввода ассоциаций.
Анализ информации. Эту функцию выполняют модули поиска словарной информации и формирования статистики. Модуль формирования статистики кроме собственно процедуры подсчета частоты использования терминов или метафор содержит процедуру наглядного представления результатов расчетов, т.е. процедуру построения графиков.
Построение отчетов. Отчеты система строит в двух формах: на бумажном носителе и в виде файла формата *.rtf. Модули формирования файлов (модули формирования текста словаря) содержат в себе процедуры для получения текста любой из частей основного текста словаря. Эти процедуры независимы друг от друга, поэтому они реализованы в виде отдельных модулей. В модуль формирования бумажных отчетов входят модули формирования текстов "прямого" и "обратного" словарей, модуль формирования списка таксонов, используемых в словаре, модуль составления текста рубрикаторов терминов и метафорических моделей. Структурная схема системы приведена на рис. 2.
Рис. 2. Структурная схема программного комплекса системы автоматизации построения словаря метафор FineStyle v.1.0
База данных исследования
Инфологическая модель базы данных исследования описана в нотации IDEF1X и показана на рис. 3. В табл. 3 и 4 приведены описания сущностей и связей. Для реализации инфологической модели базы данных исследования была выбрана СУБД Paradox 5.0 фирмы Borland. На рис. 4 показаны структуры таблиц базы данных исследования.
Рис. 3. Инфологическая модель базы данных исследования
Таблица 3
Описание сущностей инфологической
модели базы данных исследования
Сущность |
Атрибут |
Ключ |
“Рубрика терминов” (независимая). |
Номер_рубрики_терминов |
Первичный |
Название_рубрики_терминов |
|
|
Номер_родительской_рубрики |
|
|
“Метафорическая модель” независимая |
Номер_рубрики_метафор |
Первичный |
Название_рубрики_метафор |
|
|
Номер_родительской_рубрики |
|
|
“Источники контекстов” (независимая) |
Код_источника |
Первичный |
Название_источника |
|
|
Описание_источника |
|
|
“Словарная статья” (независимая) |
Номер_статьи |
Первичный |
Код_термина |
Внешний |
|
Код_метафоры |
Внешний |
|
Код_источника |
Внешний |
|
Автор_контекста |
|
|
Контекст |
|
|
“ Толкование термина” (независимая) |
Номер_толкования_термина |
Первичный |
Термин |
|
|
Толкование_термина |
|
|
Код_источника_толкования_термина |
Внешний |
|
“Толкование метафоры” (независимая) |
Номер_толкования_метафоры |
Первичный |
Метафора |
|
|
Толкование_метафоры |
|
|
Код_источника_толкования_метафоры |
Внешний |
|
“Ассоциации” (независимая) |
Номер_ассоциации |
Первичный |
Код_метафоры |
Внешний |
|
Стимул |
|
|
Реакция |
|
|
“Источники толкований терминов” (независимая) |
Код_источника_толкования_термина |
Первичный |
Название_источника |
|
|
“Источники толкований метафор” (независимая) |
Код_источника_толкования_метафоры |
Первичный |
Название_источника |
|
|
“Термины” (независимая) |
Код_термина |
Первичный |
Термин |
|
|
Номер_рубрики_термина |
Внешний |
|
“Метафоры” (независимая) |
Код_метафоры |
Первичный |
Метафора |
|
|
Номер_рубрики_модели |
Внешний |
Таблица 4
Описание связей инфологической
модели базы данных исследования
“Сущность 1” |
СВЯЗЬ |
“Сущность 2” |
[1:0,1,M| 1:1,M| 1:0,1 |1:к], [идентифицирующая | неидентифицирующая] |
“Рубрика термина” |
ВКЛЮЧАЕТ В СЕБЯ ТЕРМИН |
“Термины” |
[1:0,1,М], [неидентифицирующая] |
“Метафорическая модель” |
ВКЛЮЧАЕТ В СЕБЯ МЕТАФОРУ |
“Метафора” |
[1:0,1.М], [неидентифицирующая] |
“Источник контекстов” |
СОДЕРЖИТ МЕТАФОРУ ДЛЯ |
“Статья” |
[1:0,1,М], [неидентифицирующая] |
“Источник толкования термина” |
СОДЕРЖИТ ТОЛКОВАНИЕ ТЕРМИНА |
“Толкование термина” |
[1:0,1,М], [неидентифицирующая] |
“Источник толкования метафоры” |
СОДЕРЖИТ ТОЛКОВАНИЕ МЕТАФОРЫ |
“Толкование метафоры” |
[1:0,1,М], [неидентифицирующая] |
“Рубрика терминов” |
ОТНОСИТСЯ К РУБРИКЕ |
“Рубрика терминов” |
[1:0,1], [неидентифицирующая] |
“ Метафорическая модель” |
ОТНОСИТСЯ К РУБРИКЕ |
“Метафорическая модель” |
[1:0,1], [неидентифицирующая] |
“Метафора” |
ОПИСЫВАЕТСЯ В СТАТЬЕ |
“Словарная статья” |
[1:0,1,М], [неидентифицирующая] |
“Термин” |
ОПИСЫВАЕТСЯ В СТАТЬЕ |
“Словарная статья” |
[1:0,1,М], [неидентифицирующая] |
“Метафора” |
ОЗНАЧАЕТ |
“Толкование метафоры” |
[1:0,1,М], [неидентифицирующая] |
“Термин” |
ОЗНАЧАЕТ |
“Толкование термина” |
[1:0,1,М], [неидентифицирующая] |
“Метафора” |
ИМЕЕТ АССОЦИАЦИЮ |
“Ассоциации” |
[1:0,1,М], [неидентифицирующая] |
Рис. 4. Структура таблиц базы данных исследования
Технология сбора информации
Сбор материалов для словаря метафор производился в несколько этапов.
Изначально выбор контекстов, содержащих метафоры, осуществлялся вручную. В выбранном журнале прочитывались подряд все статьи и отмечались встретившиеся метафоры. Выбранные контексты заносились в базу данных.
Когда количество выбранных контекстов превысили 50, из БД была сделана выборка всех встретившихся метафор. Для каждой метафоры были проведены следующие операции:
В толковом словаре Ожегова выбирались слова, встречающиеся в толковании метафоры и имеющие смысловые связи с выбранной метафорой. Например, слово "армия" имеет следующее толкование:
1.Вооруженные силы государства. Советская а. Действующая а. (войска, находящиеся на фронте). Сухопутная а.
2.Сухопутные вооруженные силы в отличие от морских и воздушных сил. День Советской Армии и Военно-Морского Флота (всесоюзный праздник).
3.Оперативное войсковое объединение из нескольких корпусов, дивизий. Танковая а.
4.В дореволюционной России: обычные сухопутные войска в отличие от гвардии.
5.Перен., кого. Вообще - совокупность большого количества чем-то объединенных людей. А. читателей. Целая а. помощников.
Для метафоры "армия" были выбраны следующие слова: ВООРУЖЕННЫЕ, СИЛЫ, ВОЙСКА, СУХОПУТНЫЕ, ФРОНТ, МОРСКИХ, ВОЗДУШНЫХ, ДИВИЗИЙ, ТАНКОВЫЙ, ГВАРДИИ. В Русском ассоциативном словаре [РАС,1994] были выбраны все реакции на стимул - метафору. Для слова "армия" был получен следующий список слов: БЕДА, БЕЖИТ, БЕЗРАБОТНЫХ, ВВС США, ВОЕНКА, ВОЕННЫЙ БИЛЕТ, ВОЙНА, ВОЙСКО, ВОЮЕТ, ГЛУПОСТЬ, ГРУ, ДЕДЫ, ДУРДОМ, КРАСНАЯ, КРАСНЫХ, ЛЮБВИ, ЛЮБОВНИКОВ, МУЖИКИ, МУЖЧИНА, МЫ, НАЕМНАЯ, НАЕМНИКОВ, НАРОД, НАС БЕРЕЖЕТ, НАША, НАША ЗАЩИТА, НЕ ХОДИТЬ, ОБОЗ, ПАРАД, ПОБЕДИТЕЛЬ, ПОГОНЫ, ПРАПОРЩИК, ПРИЗЫВНИК, РОДНАЯ, РОССИИ, ДЕДОВЩИНА, РОССИЙСКАЯ, САПОГИ, ПАРНИ, СИЛА, СИЛЬНАЯ, СЛУЖУ С.С., СНОВ, СОВЕТСКАЯ, СОВЕТСКИЙ СОЮЗ, СОЛДАТ, СОЛДАТЫ, СПАСЕНИЯ, ТОЖЕ ТЮРЬМА, ТРЯСОГУЗКИ, ТЮРЬМА, УГНЕТЕНИЕ, УЖАС, ФИГОВАЯ, ФЛОТ, ФОРМА.
В качестве стимула были взяты также слова, полученные при анализе толкования метафоры.
Из полученного списка слов был сформирован поисковый запрос для программы DIALEX. В поисковый запрос входят основы слов, полученных ранее. Используя поисковый запрос, эта программа выбирает из текстового файла предложения, которые имеют в своем составе слова из поискового запроса. DIALEX сформировала текстовой файл, содержащий выбранные контексты для заданного поискового запроса.
Подобный способ получения контекстов дает очень низкие результаты. Слова, заданные в поисковом запросе, используются в выбранных контекстах в основном в своем прямом значении. Процесс же выбора нужного контекста из общего списка контекстов очень трудоемок.
Контексты, содержащие метафоры, были занесены в базу данных.
Полученные на этапе 2 слова использовались в качестве поисковых запросов для поисковой системы Yandex. Найденные данной системой контексты также были занесены в БД.
Был также продолжен ручной поиск
метафор.